Apresentação do projecto Per-Fide: Paralelizando o Português com seis outras línguas
نویسندگان
چکیده
Neste documento apresentamos o projecto Per-Fide que tem como principal objectivo a criação de recursos bilingues entre a ĺıngua portuguesa e seis outras ĺınguas: espanhol, russo, francês, italiano, alemão e inglês. Este processo iniciar-se-á com a compilação de corpora paralelos em diferentes áreas, nomeadamente a literatura, religião e poĺıtica (legislativa e juŕıdica) e técnico-cient́ıfica. Os corpora serão alinhados à frase e à palavra e serão objecto de extracção automática de dicionários e terminologia bilingues. O documento irá focar inicialmente os principais objectivos do projecto, seguindo-se uma visão geral sobre as tarefas propostas e os resultados que se esperam obter.
منابع مشابه
Reconhecimento de Informações Comuns para a Fusão de Sentenças Comparáveis do Português
A fusão de sentenças é uma tarefa que consiste em produzir, a partir de um conjunto de sentenças relacionadas, uma única sentença que resume as informações comuns apresentadas no conjunto. Essa tarefa é de grande interesse em diversas aplicações do Processamento de Língua Natural (PLN), tais como a Sumarização Automática, a Tradução Automática, os sistemas de Perguntas e Respostas, entre outros...
متن کاملExtracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação
Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constitúıdo por relações entre palavras, extráıdas de forma automática de um dicionário da ĺıngua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações inclúıdas e a sua q...
متن کاملAnálise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português
Este artigo apresenta o projeto de adaptação de métricas da ferramenta Coh-Metrix para o português do Brasil (Coh-Metrix-Port). Descreve as ferramentas de processamento de língua natural para o português que foram utilizadas, juntamente com as decisões tomadas para a criação da CohMetrix-Port. O artigo traz duas aplicações da ferramenta Coh-Metrix-Port: (i) a avaliação de textos jornalísticos e...
متن کاملBancos de Fala para o Português Brasileiro
Reconhecimento e síntese de fala demandam grandes quantidades de dados para aplicações comerciais. Em inglês americano, existem grandes quantidades de bancos de fala para a produção de modelos acústicos. Isto não é realidade para muitas línguas, incluindo o Português Brasileiro. Este trabalho apresenta o desenvolvimento de dois bancos de fala para reconhecimento com 248 locutores (224 sentenças...
متن کاملUm panorama do Núcleo Interinstitucional de Linguística Computacional às vésperas de sua maioridade
Resumo Este artigo faz uma breve apresentação do Núcleo Interinstitucional de Linguística Computacional (NILC), que é um dos principais grupos brasileiros dedicado a pesquisas na área de Processamento de Línguas Naturais, particularmente do português brasileiro. Após apresentar um breve histórico de sua formação, mostramos como as atuais áreas de pesquisa do grupo foram consolidando-se ao longo...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Linguamática
دوره 2 شماره
صفحات -
تاریخ انتشار 2010